Nature:利用人工智能设计的DNA开关开启或关闭基因,从而实现精确的基因表达控制
来源:生物谷原创 2024-11-15 10:36
作者开发了一种名为CODA(DNA活性计算优化)的平台,利用他们的人工智能模型,高效地设计出数千种具有特定特征的全新CRE。
在一项新的研究中,来自杰克逊实验室、布罗德研究所和耶鲁大学的研究人员利用人工智能设计出数千个新型 DNA 开关,这些开关可以精确控制基因在不同细胞类型中的表达。他们的新方法开辟了控制基因在体内何时何地表达的可能性,以前所未有的方式造福人类健康和医学研究。相关研究结果发表在2024年10月31日的Nature期刊上,论文标题为“Machine-guided design of cell-type-targeting cis-regulatory elements”。
论文共同通讯作者、杰克逊实验室副教授Ryan Tewhey 博士说,“这些合成设计元件的特别之处在于,它们对所设计的目标细胞类型具有显著的特异性。这为我们创造了机会,使我们可以在不影响身体其他部位的情况下,只在一个组织中增加或减少基因的表达。”
近年来,基因编辑技术和其他基因治疗方法使得科学家们有能力改变活细胞内的基因。然而,仅影响给定细胞类型或组织中的基因,而不是整个有机体的基因,一直是个难题。部分原因在于,人们一直在努力了解控制基因表达和抑制的DNA开关,即顺式调控元件(cis-regulatory element, CRE)。
在这项新的研究中,Tewhey和他的合作者不仅设计出了前所未见的新型合成CRE,还利用这些CRE成功激活了脑细胞、肝细胞或血细胞中的一些基因,而不会开启其他类型细胞中的这些基因。
组织和时间特异性指令
虽然有机体的每个细胞都含有相同的基因,但并非每个细胞或在任何时候都需要所有基因。例如,CRE 有助于确保大脑所需的基因不会被皮肤细胞使用,或者确保早期发育所需的基因不会在成年后被激活。CRE本身并不是基因的一部分,而是独立的调控 DNA 序列,通常位于它们控制的基因附近。
科学家们知道,人类基因组中有数千种不同的 CRE,每种的作用略有不同。论文共同第一作者、Tewhey实验室的计算科学家Rodrigo Castro博士解释说,CRE的语法很难弄清楚,“没有直接的规则来控制每个 CRE 的作用。这限制了我们设计只影响人体内某些细胞类型的基因疗法的能力”。
论文共同通讯作者、耶鲁大学遗传学助理教授Steven Reilly博士说,“这个项目实质上提出了一个问题:‘我们能否学会读写这些调控元件的代码?’如果我们从语言的角度来考虑,这些元件的语法和句法是很难理解的。因此,我们试图建立一种机器学习方法,能够学习比我们自己所能做到的更复杂的代码。”
作者使用一种名为深度学习的人工智能(AI),利用数十万条来自人类基因组的DNA序列训练了一种模型,他们在实验室中测量了血液、肝脏和大脑三种细胞中的CRE活性。这种人工智能模型使得他们能够从几乎无限多的可能组合中预测任何序列的活性。通过分析这些预测,他们发现了 DNA 中的新模式,了解到 DNA 中 CRE 序列的语法如何影响 RNA 的产生数量。
Malinois准确地预测了CRE的转录激活
作者随后开发了一种名为CODA(Computational Optimization of DNA Activity, DNA活性计算优化)的平台,利用他们的人工智能模型,高效地设计出数千种具有特定特征的全新CRE,比如在人类肝细胞中能激活特定基因,但在人类血液或脑细胞中却不能激活同一基因。
通过迭代研究,作者利用实验数据先建立计算模型然后加以验证计,完善并提高了这种程序预测每种CRE生物影响的能力,并设计出了自然界中从未见过的特定CRE。
作为论文共同通讯作者布罗德研究所教授Pardis Sabeti实验室的博士后研究员,论文共同第一作者Sager Gosai博士说,“天然CRE虽然数量众多,但只占可能DNA序列元件的极小一部分,而且其功能受到自然选择的限制。这些人工智能工具在设计基因开关方面有着巨大的潜力,所设计的给基因开关可以精确调节基因表达,用于生物制造和治疗等新应用。”
器官特异性CRE
Tewhey 和他的同事们通过将这些利用人工智能设计的新型合成 CRE加入到细胞中,测量它们激活给定细胞类型中基因的能力,以及它们不会激活其他细胞中基因表达的能力。他们发现,与已知与细胞类型相关的天然 CRE 相比,这些新的 CRE 甚至更具细胞类型特异性。
Gosai说,“这些合成 CRE 在语义上与天然CRE元件相去甚远,因此对其有效性的预测似乎难以置信。我们最初预计,许多这样的序列在活细胞内会表现失常。”Castro说,“CODA在设计这些元件方面的能力之强,让我们大吃一惊。”
Tewhey 和他的合作者研究了合成 CRE 比天然 CRE 性能更优越的原因,发现这些细胞特异性合成 CRE 包含在目标细胞类型中负责表达基因的序列组合,以及在其他细胞类型中抑制或关闭基因的序列。
最后,作者在斑马鱼和小鼠体内测试了几种合成 CRE 序列,结果良好。例如,有一种 CRE 能够在发育中的斑马鱼肝脏中激活荧光蛋白,但不能在斑马鱼的其他部位激活荧光蛋白。
Tewhey说,“这种技术为编写具有预定功能的新调控元件铺平了道路。这类工具对基础研究很有价值,但也可能具有重大的生物医学意义,因为人们有可能利用这些元件控制非常特定的细胞类型中的基因表达,以达到治疗目的。”(生物谷Bioon.com)
参考资料:
Ryan Tewhey et al. Machine-guided design of cell-type-targeting cis-regulatory elements. Nature, 2024, doi:10.1038/s41586-024-08070-z.
版权声明 本网站所有注明“来源:生物谷”或“来源:bioon”的文字、图片和音视频资料,版权均属于生物谷网站所有。非经授权,任何媒体、网站或个人不得转载,否则将追究法律责任。取得书面授权转载时,须注明“来源:生物谷”。其它来源的文章系转载文章,本网所有转载文章系出于传递更多信息之目的,转载内容不代表本站立场。不希望被转载的媒体或个人可与我们联系,我们将立即进行删除处理。